過去服務提供者都很喜歡談論 SLA,而現在,更多的討論則是 Service Level Objectives (SLO)。 今天要介紹的文章是個入門文章,帶領大家用簡單的範例來學習什麼是 SLO,裡面牽扯到哪些概念以及元件,以及最後該如何跟相關的監控解決方案整合,來達到提醒與通知的效果。
重點整理
1. 文章使用 Prometheus + Linkerd + Grafana 來示範
2. 如何安裝 Linkerd 以及基本驗證
3. 介紹失敗預算 (Error Budget) 的概念,除了文字敘述之外,還有用實際 PromeQL 的範例
4. 將上述 Error Budget 的資訊給整合到 Grafana 達到更方便的追蹤當前 SLO 的程度
文章內還有提及其他文章來介紹 SLO,連結如下
https://buoyant.io/2020/09/24/service-level-objectives-for-kubernetes/
https://www.cncf.io/blog/2020/11/13/a-guide-to-setting-up-kubernetes-service-level-objectives-slos-with-prometheus-and-linkerd/